首页> 外文OA文献 >The Impact of Arabic Morphological Segmentation on Broad-coverage English-to-Arabic Statistical Machine Translation
【2h】

The Impact of Arabic Morphological Segmentation on Broad-coverage English-to-Arabic Statistical Machine Translation

机译:阿拉伯语形态分割对广泛覆盖的英语到阿拉伯语统计机器翻译的影响

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Morphologically rich languages pose a challenge for statistical machine translation (SMT). This challenge is magnified when translating into a morphologically rich language. In this work we address this challenge in the framework of a broad-coverage English-to-Arabic phrase based statistical machine translation (PBSMT). We explore the full spectrum of Arabic segmentation schemes ranging from full word form to fully segmented forms and examine the effects on system performance. Our results show a difference of 2.61 BLEU points between the best and worst segmentation schemes indicating that the choice of the segmentation scheme has a significant effect on the performance of a PBSMT system in a large data scenario. We also show that a simple segmentation scheme can perform as good as the best and more complicated segmentation scheme. We also report results on a wide set of techniques for recombining the segmented Arabic output
机译:形态丰富的语言给统计机器翻译(SMT)带来了挑战。当翻译成形态丰富的语言时,这一挑战会更加严重。在这项工作中,我们将在广泛的基于英语到阿拉伯语短语的统计机器翻译(PBSMT)框架中应对这一挑战。我们探索了从全词形式到完全分段形式的阿拉伯语分段方案的全部范围,并研究了对系统性能的影响。我们的结果显示最佳分割方案和最差分割方案之间存在2.61 BLEU点的差异,这表明在大数据场景中,分割方案的选择对PBSMT系统的性能具有重大影响。我们还表明,简单的分割方案可以实现最佳和更复杂的分割方案。我们还报告了用于重组分段阿拉伯文输出的多种技术的结果

著录项

  • 作者

    Al-Haj, Hassan; Lavie, Alon;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号